تشخیص مرزهای تکواژی در زبان فارسی بر اساس اطلاعات واجی (با هدف کاربرد در برنامههای رایانهای پردازش زبان)
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده ادبیات و علوم انسانی دکتر علی شریعتی
- نویسنده مریم شمایلی
- استاد راهنما اعظم استاجی سعید راحتی قوچانی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
این پایان نامه با عنوان «تشخیص مرزهای تکواژی در زبان فارسی بر اساس اطلاعات واجی (با هدف کاربرد در برنامه های رایانه ای پردازش زبان)» به بررسی روش تجزیه ساختواژی پیشنهادی هریس (1995) و میزان کارآمدی این روش بر روی زبان فارسی میپردازد. هدف از انجام این تحقیق این است که با آزمودن مدل تجزیه ساختواژی هریس بر روی داده های نوشتاری زبان فارسی، امکان استفاده از آن را در برنامه های پردازش زبان فارسی برای تجزیه تکواژی مشخص کند. برای آزمودن روش هریس از پنجاه جمله فارسی استخراج شده از پایگاه داده های زبان فارسی برای جامعه نمونه استفاده کردیم. به دلیل عدم وجود پیکره زبان فارسی مناسب برای آزمودن فرضیه این پژوهش از سه گویشور زبان فارسی برای جمع آوری سایر داده ها کمک گرفتیم. سپس داده های جمع آوری شده را به صورت دستی، واج نویسی کردیم و به شمارش تعداد متغیر همنشینی واج ها پس از هر واج پاره گفتارها پرداختیم. تقطیع پاره گفتارها در نقاط اوج تعداد متغیر همنشینی، تکواژهای به دست آمده از این روش تقطیع را مشخص نمود. نتایج این آزمون بر روی جامعه نمونه نشان میدهد که تقطیع ساختواژی با دقت 97% و بازیابی 75% صورت گرفته است. میزان دقت 0/97 این روش برای تعیین مرزهای تکواژی، نتیجه بسیار خوبی است. نکته مهم این است که این نتایج از پردازش یک پیکره برچسب گذاری نشده، به دست آمده است. با اینکه در آزمودن روش هریس تکواژهای فارسی با دقت خوبی به دست میآیند به نظر میرسد این روش نمی تواند به عنوان مدل رایانه ای برای پردازش ساختواژی متون فارسی به کار گرفته شود و نتایج قابل قبولی را برای کاربرد در موتورهای جستجو، ماشین های ترجمه و یا دیگر برنامه های پردازش زبانی ارائه دهد. با این وجود از آنجا که در برنامه های تبدیل گفتار به متن، آواها به صورت خام به دست می آیند، به نظر میرسد این مدل بتواند متون آوانویسی شده فارسی را با دقت خوبی به تکواژها تجزیه کند و ازاین رو در برنامه های پردازش گفتار به کار رود.
منابع مشابه
اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملاثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین
Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...
متن کاملتحلیل فرایندهای واجی فعل در زبان فارسی
در این پژوهش، با تحلیل فرایندهای واجی ستاک گذشته در زبان فارسی برحسب میزان پیچیدگی و تعداد قاعدههایی که برای تبدیل به ستاک گذشته، بر ستاک حال آنها انجام میشود، این فعلها را به انواع تکقاعدهای، دوقاعدهای، سهقاعدهای و چهارقاعدهای تقسیم کردهایم. در هریک از این دستهها، یک قاعده، ازنوع ساختواژی ستاک گذشته و بقیه، قاعدههای آوایی هستند. پژوهش حاضر، بیانگر آن است که علاوهبر عناصر وا...
متن کاملتحلیل فرایند واجی قلب در زبان فارسی
مقالۀ حاضر به بررسی فرایند قلب در زبان فارسی میپردازد. معمولاً قلب فرایندی نظاممند تلقی نمیشود و درمیان انواع فرایندهای واجی بهصورت فرایندیی و فرعی درنظر گرفته میشود. بااینحال، در برخی از زبانها فرایندی منظم و قاعدهمند است. بهنظر میرسد فرایند قلب اگر "هدف ساختاری خاصی" را تأمییتواند منظم باشد. این هدفِ ساختارییتی عام و واجی داشته باشد. تحلیلِ آن در زبان فارسی نشان میدهد که این فرایند د...
متن کاملفرایندهای واجی همخوانی در واژههای مشترک بین زبان فارسی معیار و زبان هورامی (گویش هورامان تخت)
هدف از نگارش این مقاله، بررسی و توصیف فرایندهای واجی همخوانی در واژه های مشترک بین زبان فارسی معیار و زبان هورامی (گویش هورامان تخت)، یکی از زبان های ایرانی نو شاخۀ شمال غربی، است. برای گردآوری و ثبت داده ها، از ده گویشور بومی بیسواد و باسواد از زن و مرد در سنین بین 30 تا 80 سال در حدود 5 ساعت بهره گرفته شده است. از شمّ زبانی یکی از نگارندگان که گویشور بومی این گویش است و همچنین منابع مکتوب...
متن کاملتحلیل فرایندهای واجی فعل در زبان فارسی
در این پژوهش، با تحلیل فرایندهای واجی ستاک گذشته در زبان فارسی برحسب میزان پیچیدگی و تعداد قاعده هایی که برای تبدیل به ستاک گذشته، بر ستاک حال آنها انجام میشود، این فعلها را به انواع تکقاعده ای، دوقاعده ای، سهقاعده ای و چهارقاعده ای تقسیم کردهایم. در هریک از این دستهها، یک قاعده، ازنوع ساختواژی ستاک گذشته و بقیه، قاعده های آوایی هستند. پژوهش حاضر، بیانگر آن است که علاوهبر عناصر وا...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده ادبیات و علوم انسانی دکتر علی شریعتی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023